Información colocacional y recuperación de la información
نویسندگان
چکیده
Este proyecto tiene como objetivo investigar la significación de la información colocacional en Recuperación de la información (RI). Una colocación es una relación entre dos unidades léxicas (UL) L1 y L2 tal que para expresar un significado específico en relación con L1 la elección de L2 no es libre (Mel' uk 1995). Así, para expresar el sentido 'hacer lo que está previsto que se debe hacer' en relación con la UL CARGO, podemos decir desempeñar un cargo. El mismo sentido predicado de PROMESA se expresaría por CUMPLIR y en combinación con SECRETO, por GUARDAR. El peso semántico de L1 y L2 no está equilibrado: mientras L1 (la base de la colocación) guarda el sentido que tiene cuando no está en colocación, el significado de L2 (el colocativo) está reducido o modificado cuando aparece en colocación Las siguientes propiedades de las colocaciones las hacen interesantes para RI: 1) A la hora de indexar un texto, los elementos de una colocación no pueden ser considerados como términos aislados: es evidente que la aportación de ABANDONAR en abandonó al niño, donde la UL es usada libremente, no es la misma que la aportada en la colocación abandonó el cargo; 2) Una base dada puede formar varias colocaciones con el mismo significado. Así, el nombre CARGO no sólo selecciona ABANDONAR, sino también RENUNCIAR, DIMITIR (de) o CESAR (en). 3) Las colocaciones pueden der clasificadas según una tipología semánticamente motivada. Nuestra hipótesis es que estas propiedades deben tener ciertos efectos en los resultados de la RI. A pesar de que en los últimos años se registra una fuerte tendencia a utilizar información lingüística para RI, no se han explorado hasta ahora las colocaciones. La razón se debe a que no existía ningún procedimiento fiable de reconocimiento automático de colocaciones en los documentos. Sin embargo, algunos trabajos previos basados en la tipología de las funciones léxicas (FL) (Wanner y Alonso 2001 y Wanner en preparación) han mostrado la posibilidad de identificar automáticamente colocaciones verbo-nombre. Actualmente hemos extendido el mismo enfoque para reconocer colocacaciones nombre-adjetivo y verbo-adverbio. En nuestra investigación sobre RI, usamos esta estrategia para la identificación de colocaciones tanto en los documentos como en las consultas de los usuarios y pretendemos usar la información colocacional para mejorar los resultados de RI.
منابع مشابه
Distinción semántica de compuestos léxicos en Recuperación de información
Resumen: La consideración de sintagmas no parece producir mejoras significativas en los modelos clásicos de Recuperación de Información. En general, se acepta que los criterios de proximidad proporcionan mejores resultados que un criterio de adyacencia. El trabajo que se presenta explora la hipótesis de que no todos los compuestos léxicos deben considerarse de la misma forma. Se propone un proc...
متن کامل[Google: Searches, analyses and networking in the health care environment].
La enfermerı́a, como todas las disciplinas de las Ciencias de la Salud, se encuentra en constante cambio y requiere de un gran esfuerzo investigador y formativo por parte de sus profesionales para garantizar la mejor atención y los mejores cuidados. El acceso al mejor conocimiento cientı́fico disponible y las Tecnologı́as de la Información y Comunicación (TIC) juegan un papel fundamental en esta p...
متن کاملUna Plataforma Colaborativa de Recuperación de Información
El número creciente de información disponible a través de la Internet hace necesarias herramientas para la selección de los datos a los cuales se desea acceder. Por otra parte la posibilidad de compartir datos e información permite el desarrollo de sistemas para el soporte de la colaboración entre usuarios. Este trabajo presenta una plataforma de recuperación de información colaborativa para la...
متن کاملPrimera aproximación de un sistema de recuperación de información booleano con expansión semántica de consultas
Resumen. En el presente trabajo se propone una aproximación que utiliza la expansión de consultas en un Sistema de Recuperación de Información Booleano (SRIB), con la finalidad de mejorar el nivel de precisión de un SRIB sin expansión. Las consultas están formadas por los conceptos y relaciones existentes en ontoloǵıas de dominio. El SRIB sin expansión y con expansión asocia a cada consulta la ...
متن کاملOrnitología Virtual: Caracterizando a #Chile en Twitter
Este art́ıculo presenta un análisis de los tweets recolectados el 28 de Octubre de 2012, en el contexto de las elecciones municipales de 2012 en Chile. Dicho análisis se realiza mediante una metodoloǵıa basada en literatura previa, en particular en técnicas de recuperación de la información y de análisis de espacios de información. Como resultado, se determinan: 1) caracteŕısticas demográficas b...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 31 شماره
صفحات -
تاریخ انتشار 2003